Máy học véc tơ hỗ trợ là gì? Các công bố khoa học về Máy học véc tơ hỗ trợ

Máy học véc tơ hỗ trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng trong lĩnh vực học máy để xây dựng mô hình dự đoán và phân l...

Máy học véc tơ hỗ trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng trong lĩnh vực học máy để xây dựng mô hình dự đoán và phân loại. Thuật toán này dựa trên cơ sở ý tưởng tìm kiếm một ranh giới phân chia (đường phân chia) tối ưu giữa các điểm dữ liệu thuộc vào các nhóm khác nhau.

Máy học véc tơ hỗ trợ cố gắng tối đa hoá khoảng cách giữa đường phân chia và các điểm dữ liệu gần nhất, có tên gọi là vector hỗ trợ. Thuật toán sử dụng các phép biến đổi không gian (kernel) để có thể tìm được đường phân chia tối ưu ngay cả khi dữ liệu không phân chia tuyến tính được.

Với tính linh hoạt trong việc xử lý dữ liệu, SVM có thể được áp dụng trong nhiều bài toán khác nhau như phân loại hình ảnh, nhận dạng chữ viết tay, phân loại văn bản, và nhiều ứng dụng khác.
Để hiểu chi tiết hơn về máy học véc tơ hỗ trợ, hãy xem qua các khái niệm và các bước thực hiện cơ bản của thuật toán SVM:

1. Khái niệm căn bản:
- Vector hỗ trợ: Là các điểm dữ liệu gần nhất với đường phân chia (đường biên). Vector hỗ trợ quyết định vị trí và hình dạng của đường phân chia.
- Đường phân chia tối ưu: Là đường thẳng, mặt phẳng, hoặc siêu phẳng trong không gian n chiều, tách hoặc phân chia các điểm dữ liệu thuộc vào các nhóm khác nhau. Mục tiêu của SVM là tìm ra đường phân chia tối ưu có thể phân loại đúng nhưng còn đảm bảo độ tổng quát cao (không bị overfitting).

2. Bước thực hiện cơ bản:
- Chuẩn bị dữ liệu: Dữ liệu huấn luyện (training data) cần được chuẩn bị trước. Mỗi điểm dữ liệu sẽ được biểu diễn dưới dạng véc tơ. Nếu dữ liệu là không phân chia tuyến tính, một phép biến đổi không gian (kernel) sẽ được sử dụng để biến đổi dữ liệu vào một không gian mới có thể phân chia tuyến tính.
- Xây dựng mô hình: Mục tiêu là tìm ra đường phân chia tối ưu. Đường phân chia tối ưu sẽ được xác định bằng cách tìm kiếm đường biên (biên cực đại) sao cho khoảng cách từ đường biên đến các điểm dữ liệu gần nhất là lớn nhất.
- Học mô hình: Thuật toán SVM sẽ tối ưu hóa các thông số của mô hình bằng cách giải một bài toán tối ưu hóa. Mục tiêu là tìm ra các trọng số tối ưu cho mô hình, đồng thời xác định các vector hỗ trợ.
- Dự đoán: Sau khi mô hình đã được huấn luyện, nó có thể được sử dụng để dự đoán nhãn của các điểm dữ liệu mới. Dự đoán dựa trên việc so sánh vị trí của điểm dữ liệu mới với đường phân chia tối ưu đã xác định.

Trên thực tế, thuật toán SVM có thể được tùy chỉnh bằng cách thay đổi các thông số như kernel (linear, polynomial, RBF, sigmoid,...), thông số C (khi xác định độ ràng buộc cho các điểm dữ liệu) và thông số gamma (trong kernel RBF). Những thay đổi này có thể ảnh hưởng đến hiệu suất của mô hình SVM.

Danh sách công bố khoa học về chủ đề "máy học véc tơ hỗ trợ":

Đánh giá các thuật toán phân loại trong việc dự đoán những rủi ro về tài chính
Rủi ro tài chính luôn là đề tài gây hứng thú cho các nhà nghiên cứu và những nhà đầu tư. Vì vậy, việc dự đoán những rủi ro tài chính trong nền kinh tế hiện nay là cần thiết. Và cách lựa chọn được một hay nhiều lớp phân loại là nhiệm vụ quan trọng. Mục đích bài báo này là sử dụng ba thuật toán phổ biến của phương pháp máy học; máy học vecto hỗ trợ, cây quyết định và thuật toán Naïve Bayes; để dự đoán khả năng rủi ro của ba bộ dữ liệu tài chính - Qualitative Bankruptcy, Japanese bankruptcy and Australian credit card application. Kết quả cho thấy rằng thuật toán SVM cho kết quả phân loại tốt nhất và đáng tin cậy với độ chính xác lần lượt cho ba bộ dữ liệu Qualitative Bankruptcy, Japanese bankruptcy and Australian credit card application là 99.6000%, 87.652% và 86.783%. Tuy nhiên, kết quả của hai thuật toán còn lại cho ba bộ dữ liệu trên cũng đạt kết quả tốt. Nghiên cứu này còn muốn chứng minh tính hiệu quả của phương pháp máy học trong việc phân loại rủi ro tài chính.
#Rủi ro tài chính #kỹ thuật học máy #máy học vecto hỗ trợ #cây quyết định #Naïve Bayes
Ứng dụng mô hình máy học Véc-tơ tựa (SVM) trong phân tích dữ liệu điểm sinh viên
Bài báo này đề xuất ứng dụng mô hình kết hợp máy học véc-tơ tựa và hệ thống mờ trong việc trích xuất luật mờ từ dữ liệu điểm sinh viên. Máy học Véc-tơ tựa (SVMs) và hệ thống luật mờ có sự tương đương nhau với một số điều kiện nhất định. Trên cơ sở phân tích sự tương đương giữa mô hình máy học Véc-tơ tựa với mô hình mờ (Fuzzy model), chúng tôi đề xuất một mô hình tích hợp SVMs và Fuzzy model để trích xuất luật mờ từ kết quả huấn luyện SVMs. Thuật toán f-SVM cho phép sản xuất được các luật mờ từ dữ liệu huấn luyện. Dữ liệu điểm thực tế của sinh viên được sử dụng để kiểm tra khả năng thực hiện của mô hình đề xuất. Tập luật mờ trích xuất được từ tập dữ liệu huấn luyện bằng thuật toán f-SVM, sẽ được sử dụng để suy luận trên tập dữ liệu thử nghiệm.
#Máy học véc-tơ tựa #mô hình mờ #khai phá luật kết hợp #khai phá dữ liệu #luật mờ
Sử dụng lí thuyết tập thô cho việc tạo cấu trúc cây Hah trong phân lớp đa lớp
Trong bài báo này, chúng tôi sử dụng chiến lược phân lớp Half- against-Half và bộ phân lớp nhị phân Support Vector Machines (SVMs) cho bài toán phân lớp đa lớp. Trong đó, để tạo cấu trúc cây cho HAH, chúng tôi đề xuất một thuật toán dựa trên lí thuyết tập thô (Rough Set Theory – RST). Kết quả của thuật toán sẽ được so sánh với một số chiến lược phân đa lớp phổ biến dựa trên bộ phân lớp SVMs. Normal 0 false false false EN-US X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Calibri","sans-serif";}
#lí thuyết tập thô #Haft-against-Haft #máy học hỗ trợ vector
Dự báo sự tiêu thụ điện ở thành phố Đà Nẵng sử dụng mô hình kết hợp cửa sổ dịch chuyển và hồi quy máy học được tối ưu bởi trí tuệ bầy đàn
Dự báo điện năng đóng vai trò quan trọng trong hệ thống quản lý năng lượng. Một công cụ dự báo hiệu quả sẽ hỗ trợ các công ty đưa ra các quyết định về mua, sản xuất điện, truyền tải, và phát triển hạ tầng. Nghiên cứu này phát triển một mô hình dự báo điện năng kết hợp lý thuyết cửa sổ dịch chuyển và máy học véc-tơ hỗ trợ (LSSVR) được tối ưu bởi thuật toán con đom đóm (FA). Cửa sổ dịch chuyển được sử dụng để lựa chọn dữ liệu lịch sử hợp lý cho dự báo. Thuật toán con đom đóm nhằm tối ưu tham số của LSSVR để cải thiện độ chính xác dự báo. Một bộ dữ liệu thực tế được thu thập ở thành phố Đà Nẵng được sử dụng để kiểm chứng khả năng dự báo của mô hình đề xuất MFA-LSSVR. Kết quả thực nghiệm cho thấy mô hình đề xuất có khả năng dự báo tốt hơn mô hình moving-window LSSVR và moving-window ARIMA. Kết quả của nghiên cứu này cung cấp một công cụ tiềm năng và hiệu quả để dự báo sự tiêu thụ điện năng.
#Sự tiêu thụ điện #độ chính xác dự báo #lý thuyết cửa số dịch chuyển #trí tuệ bầy đàn #máy học véc-tơ hỗ trợ
Mô hình phân loại chất lượng nguồn nước hồ chứa bằng sự kết hợp chiến lược một đối một và bình phương máy học véc tơ hỗ trợ
Một hệ thống quản lý nguồn nước không hiệu quả có thể trở thành một trong những bất lợi chính cho quá trình phát triển bền vững của loài người. Vì vậy, mô hình phân loại chất lượng nguồn nước tại hồ chứa là rất cần thiết để giải quyết vấn đề môi trường và đây cũng là công cụ hữu ích cho sự cân bằng quá trình ô nhiễm. Bài báo này đề xuất mô hình phân loại chất lượng nguồn nước tại hồ chứa dựa vào sự kết hợp giữa chiến lược một đối một và bình phương máy học vec-tơ hỗ trợ. Bài báo phân tích và so sánh kết quả đạt được với những mô hình và thuật toán phân loại khác để chứng minh sự phù hợp của mô hình được đề xuất trong việc phân loại chất lượng nguồn nước hồ chứa với độ chính xác đạt được là 92.196%
#Hệ thống quản lý #mô hình phân loại #chất lượng nguồn nước hồ chứa #một đối một #bình phương máy học vec-tơ hỗ trợ
Tối ưu hóa mô hình mờ TSK trích xuất từ máy học véc-tơ hỗ trợ hồi quy với tham số epsilon
Mô hình mờ TSK và mô hình máy học véc-tơ hỗ trợ hồi quy có sự tương đương nhau trong một số điều kiện nhất định. Bằng cách thỏa mãn các điều kiện đề đồng nhất các hàm đầu ra của mô hình mờ TSK và máy học véc-tơ hỗ trợ hồi quy, chúng ta có thể xây dựng một thuật toán cho phép trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ trợ. Bài báo này không những đưa ra thuật toán cho phép trích xuất mô hình mờ TSK từ máy học véc tơ hỗ trợ mà còn đề xuất một giải pháp cho phép tối ưu hóa mô hình mờ nhận được thông qua việc điều chỉnh tham số ε. Việc điều chỉnh tham số ε sẽ cho phép trích xuất được mô hình vừa đảm bảo tính chính xác trong dự đoán đồng thời có thể giảm độ phức tạp và tăng “tính diễn dịch” của mô hình. Hiệu quả của giải pháp đề xuất được đánh giá thông qua các kết quả thực nghiệm và có sự so sánh với kết quả của một số mô hình khác.
#mô hình mờ #mô hình mờ TSK #luật mờ #máy học véc-tơ hỗ trợ #máy học véc-tơ hỗ trợ hồi quy
Phát hiện lỗi của thép tấm dựa trên sự kết hợp của chiến lược one-against-one và máy học véc tơ hỗ trợ
Phát hiện lỗi đã trở thành một vấn đề quan trọng đối với ngành công nghiệp sản xuất trong những năm qua. Một hệ thống phát hiện lỗi hiệu quả sẽ thúc đẩy chất lượng sản xuất và giảm chi phí kiểm tra sản phẩm. Bài báo này đề xuất một sự kết hợp của chiến lược one-against-one (OAO) và máy học véc-tơ hỗ trợ (SVM) để phát hiện các lỗi của thép tấm. Chiến lược OAO được sử dụng để hỗ trợ SVMs thực hiện đa phân lớp (đó là, OAO-SVM). Sự thể hiện của mô hình đề xuất được so sánh với mô hình SVM dựa trên các thuật toán tối ưu. Kết quả phân tích chỉ ra rằng mô hình OAO-SVM vượt trội các mô hình khác trong việc phát hiện lỗi với độ chính xác tới 86.357%.Kết quả của bài báo này, vì vậy, thể hiện sự kết hợp tiềm năng của chiến lược OAO và mô hình SVM trong việc phân loại các lỗi phổ biến của thép tấm nói riêng và những sản phẩm công nghiệp nói chung.
#one-against-one #Phát hiện lỗi #máy học véc-tơ hỗ trợ #thép tấm #độ chính xác trong phân loại
Học Đo Lường Khoảng Cách Cho Máy Vector Hỗ Trợ: Một Tiếp Cận Học Nhiều Đầu Kernel Dịch bởi AI
Springer Science and Business Media LLC - Tập 50 - Trang 2899-2923 - 2019
Công việc gần đây trong việc học đo lường khoảng cách đã cải thiện đáng kể hiệu suất trong phân loại hàng k-láng giềng gần nhất. Tuy nhiên, độ đo lường đã học bằng những phương pháp này không thể thích ứng với máy vector hỗ trợ (SVM), một trong những thuật toán phân loại phổ biến nhất sử dụng các khoảng cách để so sánh các mẫu. Để điều tra khả năng phát triển một mô hình mới cho việc học đồng thời giữa độ đo lường khoảng cách và bộ phân loại kernel, trong bài báo này, chúng tôi cung cấp một sơ đồ tham số hóa mới để kết hợp khoảng cách Mahalanobis bình phương vào kernel Gaussian RBF, và định hình việc học kernel trong khuôn khổ học nhiều kernel tổng quát, hướng tới phân loại SVM. Chúng tôi chứng minh tính hiệu quả của thuật toán được đề xuất trên các tập dữ liệu máy học UCI với kích thước và độ khó khác nhau cùng hai tập dữ liệu thực tế. Kết quả thực nghiệm cho thấy mô hình đề xuất đạt được độ chính xác phân loại cạnh tranh và thời gian thực thi có thể so sánh bằng cách sử dụng bộ tối ưu hóa gradient dự kiến phổ so với các phương pháp tiên tiến nhất.
#học đo lường khoảng cách #máy vector hỗ trợ #phân loại #kernel Gaussian RBF #học nhiều kernel
Dự đoán giá cổ phiếu công ty xây dựng bằng cửa sổ trượt hồi quy máy học tối ưu
Dự đoán thay đổi giá cổ phiếu đóng vai trò quan trọng trong sự phát triển của công ty. Nhưng dự đoán giá cổ phiếu rất khó khăn vì số liệu của nó rất phức tạp. Mục đích của bài báo là đề xuất mô hình dự đoán giá cổ phiếu các công ty xây dựng dựa vào cửa sổ trượt và hồi quy máy học tối ưu. Mô hình liên kết giữa thuật toán đom đóm và bình phương vec-tor hỗ trợ hồi quy. FA giúp điều chỉnh hệ số của LSSVR. Mô hình đưa ra gọị là FA-LSSVM. Nghiên cứu sử dụng dữ liệu giá cổ phiếu một số công ty xây dựng Đài Loan; 2545.TW, 2597.TW và 5534.TW; để làm rõ tính hiệu quả của mô hình. Kết quả cho thấy đối với dữ liệu 2597.TW, mô hình FA-LSSVM đạt kết quả tốt nhất với sai số tiêu chuẩn 1.548, sai số bình phương tuyệt đối 0.617, phần trăm sai số bình phương tuyệt đối 1.372%, và sai số toàn phương trung bình 2.396. Vì vậy, mô hình đề xuất là công cụ dự báo đáng mong đợi cho vấn đề chuỗi thời gian phi tuyến tính.
#Giá thị trường chứng khoán #cửa sổ trượt #máy học #thuật toán con đom đóm #bình phương vector hỗ trợ hồi quy #chuỗi thời gian
MÔ HÌNH HAI GIAI ĐOẠN DỰ ĐOÁN GIÁ CỔ PHIỂU VỚI K-MEANS VÀ FUZZY-SVM
Bài báo đề xuất một mô hình dự đoán giá cổ phiếu kết hợp K-Means và fuzzy – Support Vector Machines (fuzzy-SVM). Việc trích xuất tập luật mờ từ dữ liệu thô dựa vào sự kết hợp của các mô hình học thống kê chính là cơ sở của mô hình đề xuất. Kiến trúc của mô hình gồm hai giai đoạn, giai đoạn một sẽ áp dụng thuật toán K-means để phân chia không gian dữ liệu đầu vào thành nhiều cụm riêng biệt. Ở giai đoạn hai, với mỗi phân vùng của dữ liệu đầu vào, mô hình fuzzy-SVM (thuật toán f-SVM) sẽ được sử dụng để khai phá các luật mờ sử dụng cho hệ thống dự đoán. Mô hình đề xuất được áp dụng dự đoán cho một số mã cổ phiếu của thị trường chứng khoán Việt Nam. Các thông số đánh giá kết quả thực nghiệm sẽ được giới thiệu, và có sự so sánh với kết quả của một số mô hình khác.
#K-Means #dự đoán giá cổ phiếu #mô hình mờ #mô hình mờ hướng dữ liệu; #luật mờ #máy học Véc-tơ hỗ trợ
Tổng số: 11   
  • 1
  • 2